大语言模型推理效率迎来突破。清华大学与Moonshot AI联合提出“预填充即服务”新架构,通过将推理过程拆分为预填充和解码两个阶段,并优化算力资源分配,有效解决硬件限制问题,显著提升模型服务性能。
Moonshot AI与清华大学提出预填充即服务(PrfaaS)新架构,旨在解决大型语言模型推理中计算资源瓶颈。该架构将高计算密集的预填充阶段(生成键值缓存)与解码阶段分离,以优化资源利用,突破传统服务限制。
月之暗面(Moonshot AI)在Kimi K2.5模型发布仅一个月后,年度经常性收入(ARR)突破1亿美元,创下国产大模型企业变现新纪录。这标志着大模型商业化进入爆发期,算力资源供不应求,企业需预付千万美元锁定供应。
中国大模型行业竞争焦点正从技术转向资本。月之暗面(Moonshot AI)态度突变,从“不急于上市”转为接触投行评估赴港IPO,并启动新一轮10亿美元融资,投前估值达170亿-180亿美元。其K2.5模型商业化进程成为关键驱动力,推动行业进入资本定价新阶段。
全球首个20万汉字智能助手
月之暗面AI助手,您的私人AI伙伴
Anthropic
$21
输入tokens/百万
$105
输出tokens/百万
200
上下文长度
Alibaba
-
$2
256
Bytedance
$0.8
Moonshot
$4
$16
Tencent
$1
32
Deepseek
$12
128
Baidu
DevQuasar
这是一个基于Moonshot AI技术的量化版本模型,专注于视觉语言理解与生成任务,致力于降低知识获取门槛,让知识为每个人所用。
moonshotai
Kimi K2 Thinking 是月之暗面(Moonshot AI)开发的最新一代开源思维模型,具有强大的深度推理能力和工具调用功能。该模型采用混合专家架构,支持原生INT4量化,拥有256k上下文窗口,在多个基准测试中表现出色。
anikifoss
这是对Moonshot AI的Kimi-K2-Instruct-0905模型的高质量量化版本,采用HQ4_K量化方法,专门优化了推理性能,支持75000上下文长度,适用于文本生成任务。